tg-me.com/machinelearning_interview/1792
Last Update:
π¦ ΠΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½Π°Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° Π² llama.cpp (ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅)
llama.cpp ΡΠ΅ΠΏΠ΅ΡΡ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅Ρ ΠΌΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΡΠΌ Π²Π²ΠΎΠ΄ΠΎΠΌ!
π¦ Π§ΡΠΎ Π½ΠΎΠ²ΠΎΠ³ΠΎ
ΠΡΠΎΠ΅ΠΊΡ llama.cpp
ΡΠ΅ΠΏΠ΅ΡΡ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅Ρ *ΠΌΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ* β ΡΠ°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ LLaVA 1.5 / 1.6, BakLLaVA, Obsidian, MobileVLM ΠΈ Π΄ΡΡΠ³ΠΈΠ΅, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡ Π²ΡΠΏΠΎΠ»Π½ΡΡΡ Π²ΡΠ²ΠΎΠ΄, ΡΠΎΠ²ΠΌΠ΅ΡΠ°ΡΡΠΈΠΉ ΡΠ΅ΠΊΡΡ ΠΈ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π»ΠΎΠΊΠ°Π»ΡΠ½ΠΎ, Π±Π΅Π· ΠΎΠ±Π»Π°ΠΊΠ°.
π§ ΠΠ»ΡΡΠ΅Π²ΡΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠΈ
β’ ΠΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Ρ Π²Π²ΠΎΠ΄ΠΎΠΌ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ (image + text)
β’ ΠΠΎΠ²ΡΠΉ CLI: llama-mtmd-cli
(Π·Π°ΠΌΠ΅Π½ΡΠ΅Ρ `llava-cli`)
β’ Π Π°ΡΡΠΈΡΠ΅Π½Π° ΡΠΎΠ²ΠΌΠ΅ΡΡΠΈΠΌΠΎΡΡΡ: ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° GGUF-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½ΠΎΠ³ΠΎ ΡΠΈΠΏΠ°
β’ ΠΠΎΠΊΠ°Π»ΡΠ½Π°Ρ ΡΠ°Π±ΠΎΡΠ° Π½Π° CPU ΠΈ GPU Π±Π΅Π· Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΎΡ ΠΎΠ±Π»Π°ΡΠ½ΡΡ
API
π ΠΠ°ΠΊ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ
1. Π‘ΠΊΠ°ΡΠ°ΠΉ ΠΌΠΎΠ΄Π΅Π»Ρ Π² ΡΠΎΡΠΌΠ°ΡΠ΅ .gguf
, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ LLaVA:
https://huggingface.co/liuhaotian/llava-v1.5-13b-GGUF
2. ΠΠΎΠ΄Π³ΠΎΡΠΎΠ²Ρ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, `photo.jpg`)
3. ΠΠ°ΠΏΡΡΡΠΈ CLI:
./build/bin/llama-mtmd-cli \
-m models/llava-v1.5-13b.gguf \
--image ./photo.jpg \
-p "Π§ΡΠΎ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΎ Π½Π° ΡΠΎΡΠΎ?"
βͺ GitHub
BY Machine learning Interview

Share with your friend now:
tg-me.com/machinelearning_interview/1792